[DAY19]服用Python-網路爬蟲2

15th鐵人賽

Jenny

2023-10-04 10:45:00

986 瀏覽

分享至

前言

昨天簡單介紹了爬蟲，那今天就來看他可以應用在哪裡吧！

新聞標題爬蟲

範例：

import requests                #匯入requests庫，用於發送HTTP請求
from bs4 import BeautifulSoup  #匯入BeautifulSoup庫，用於解析HTML

# 指定目標網址
url = 'https://news.tvbs.com.tw/?gclid=CjwKCAjw9-6oBhBaEiwAHv1QvCY-QQ2rHzNGuWGwUbYz9ODropCgXVOTS8i1p0CrpEQrd-_Ad3zAwBoCqYEQAvD_BwE'

response = requests.get(url)  #發送HTTP GET請求獲取網頁內容

if response.status_code == 200:  #檢查請求是否成功
    soup = BeautifulSoup(response.text, 'html.parser') #解析HTML內容
    
    #在這裡可以使用BeautifulSoup方法來提取所需的信息
    # 例如：擷取所有標題
    titles = soup.find_all('h1')
    
    for title in titles:    
        print(title.text)   #印出標題
else:
    print('無法造訪網頁')
    
    
    首頁|TVBS新聞網

注意：爬蟲應該以合法且尊重網站使用條款和隱私政策的方式運行。未經許可的爬蟲活動可能會有法律問題或網站遭受損害喔！

今天就先學到這邊吧～
目前進度：19/30···